DCASE 2024の上位を見て方法を知る
モデルのアーキテクチャ
利用モデル
事前学習済みTransformer
要調査
各モジュールの役割
Transformerでグローバルを,CNNでローカルな特徴を取り,RNNで全体の時間的な変化を取る
事前学習済みモデルはグローバルな特徴抽出に優れる
CRNNはよりローカルで細かい特徴抽出が可能
! 各モジュールの役割を理解する: もう少し細かい理解が必要.特にTransformerをなぜ音の解析に使うか リソースまとめ
ベースライン
上位の報告書
2節を読む > 後で良い. 系統が全く異なっている
報告書の所感
ベースラインが相当優秀
ほとんど全ての報告書が,ベースラインの構造をあまり崩していない
同様の学習手法で他のモデルの精度を確認する方針がいいのでは